#A19 Pro
蘋果發佈會沒說的都在這了:A19 Pro、散熱和自研基帶
9 月 10 日凌晨,蘋果發佈了 iPhone 17 系列的四款新機,並同步推出了新一代 A19 晶片。在發佈會前,外界對 A19 的期待主要集中在性能提升、電晶體數量增加等量化指標上,這被普遍認為是一次常規升級。Kaiann Drance(圖片來源:蘋果秋季新品發佈會)然而,在長達1小時12分鐘的發佈會上,A19 和 A19 Pro 雖三度登場,但負責介紹的 iPhone 全球行銷副總裁 Kaiann Drance 與無線軟體技術副總裁 Tim Millet,對於 A19 在 CPU 方面的具體提升卻著墨甚少,並未透露更多細節。Tim Millet(圖片來源:蘋果秋季新品發佈會)發佈會後,我們有機會與剛走下舞台的 Kaiann Drance 和 Tim Millet 面對面交流,深入探討這顆晶片,也因此聽到了關於 A19 的更多幕後故事。01. GPU藏著的“秘密”蘋果關於A19工藝的描述(圖片來源:蘋果中國官網)在最新產品頁面更新後,蘋果明確標註 A19 晶片採用了第三代 3nm 工藝,這一資訊與發佈會前 “其將搭載台積電 N3P 工藝” 的傳聞完全吻合,印證了外界此前的猜測。關於 CPU 性能提升,Kaiann 在發佈會後首次披露:相較於去年的 A18 Pro,今年 A19 Pro 的處理器性能提升約 10%。不過,這一升級幅度基本未超出發佈會前外界對該晶片的預期 —— 也正因此,蘋果在發佈會上對 CPU 性能提升的介紹著墨甚少。從 N3E 工藝到 N3P 工藝的迭代本身偏向平穩,對於擅長講述 “革命性” 技術故事的蘋果而言,10% 的性能提升確實不足以成為發佈會上重點強調的亮點。事實上,A19 Pro 真正的核心升級藏在下圖的右下角 ——GPU 神經網路加速器。A19 Pro上首次出現了GPU神經網路加速器(圖片來源:蘋果秋季新品發佈會)這一功能在發佈會上披露的資訊有限,卻成為外界解讀最多的關鍵改進:蘋果為 A19 Pro GPU 的每一個核心都對應增加了一個神經網路加速器,根據官方資料,其 GPU 峰值運算能力已提升至 A18 Pro 的 3 倍。這一設計類似於輝達 Tensor Core,與蘋果此前長期採用、適用於低功耗場景的 “神經網路引擎(Neural Engine)” 形成區別。在被問及為什麼要設計GPU加速器時,Tim Millet表示,“提效”是他們最核心關注的問題。Tim Millet向作者舉例說明,原來在沒有GPU神經網路加速器的A系列處理器上,如果要處理一個本地化複雜的推理運算,GPU會把這個任務通過統一記憶體傳送給Neural Engine進行處理,處理完成之後,Neural Engine再將資料結果回傳到GPU上。儘管統一記憶體已讓這一過程足夠快速,但蘋果發現,即便資料傳輸路徑較短,仍存在因資料交換產生的資源浪費。而 GPU 內建加速器的設計,能讓原本可在 GPU 端處理的任務直接留在 GPU 內部完成,減少資料交換環節,那怕只提升千分之一秒的效率。不過,這一設計也存在明顯矛盾點:GPU加速器雖性能更強、效率更高,但在應對高性能模型場景時,往往伴隨更高能耗。同時,受手機產品形態限制, A19 Pro 端側推理與生成式能力仍受限於記憶體頻寬、可用記憶體量、晶片尺寸等硬體條件。若僅為提升 “一點點效率”,這樣的設計難免讓人覺得 “用力過猛”。針對這一疑問,Tim Millet補充了蘋果的第二個設計考量:在當下的手機使用場景中,純人工智慧推理或生成式任務(如摺積網路 CNN、長短期記憶網路 LSTM、Transformer 模型等),更適合在 NPU(神經網路處理單元)中完成;但現實中,手機端更多是“混合式工作流”,不會依賴單一核心完成任務,而是需要 CPU、GPU、NPU 與統一記憶體協同運作。而 GPU 神經網路加速器的設計初衷,正是為瞭解決混合工作流中的複雜任務場景,例如 MetalFX 超分技術,便會在此次升級中實現顯著提升。結合蘋果提供的最新資訊,GPU的神經網路加速器能夠與全新16核神經引擎協同工作,加上動態快取的更新,FP16的運算性能提升了一倍,建構了新的統一圖像壓縮技術,配合動態記憶體頻寬繼續提升,在A19 Pro的加持下,iPhone 17 Pro、Pro Max包括今年全新的iPhone Air,都能更好應對一些對GPU要求很高的AI任務,比如本地運行大語言模型、玩一些對圖形處理要求極高的遊戲,實現硬體加速的光線追蹤和更高的影格率。那大膽設想一下,如果蘋果邁出的這一步,“實驗”的成果得以被驗證是正向的,今年Q4可能會亮相的M5晶片有可能也會採用類似的設計,這就意味著,M5在GPU上,AI的運算能力會被推到一個前所未有的高度。蘋果在今年3月發佈的M3 Ultra,已經將統一記憶體的頻寬提升到了819GB/s,如果未來M4 Ultra或者是M5 Max,可以搭配速度更快的LPDDR 6記憶體,將頻寬推到900GB/s以上,配合蘋果在A19 Pro的GPU神經網路加速器上的實驗成果,未來Mac上的端側運算能力將不可小覷。02. 鈦換鋁,蘋果的一次賭注iPhone 17 Pro的設計成為熱議焦點,核心在於蘋果將鈦金屬中框換回鋁合金,並將Pro拉到了和標準版一個水平線上。這一 "降級" 之舉背後,是為全新主動散熱系統讓路——鋁的導熱性是鈦的 20 倍,更適合散熱需求。儘管主動散熱在Android陣營已很普遍,但 VC 均熱板在 iPhone 上尚屬首次。蘋果將其封裝在主機板背面,直接與中框相連,內部的去離子水通過汽化/液化循環高效帶走熱量,專門服務於 A19 Pro 晶片。蘋果今年在iPhone 17 Pro系列中使用的VC均熱板(圖片來源:蘋果秋季新品發佈會)在今年之前,蘋果都使用更為傳統的石墨作為晶片的散熱系統,今年VC均熱板的升級,表明蘋果對 A19 Pro 的持續高性能輸出有了更高要求。Kaiann Drance表示根據蘋果的測試顯示,在極限的持續工作環境下,搭配了VC均熱板的A19 Pro對比沒有搭載VC均熱板的A18 Pro,持續時間比後者提升了40%。這意味著,從今年開始,蘋果已經真正重視起日常應用中三大高負載場景帶來的散熱挑戰:遊戲性能提升:A19 Pro 的 GPU 神經網路加速器增強了渲染能力,同時也增加了散熱壓力;影像處理升級:新鏡頭系統和 Pro 系列影像定位導致拍攝時發熱加劇;AI 任務增加:裝置在現有硬體條件下承擔了更多推理和生成式 AI 任務。A19晶片上引入的顯示驅動單元(圖片來源:蘋果秋季新品發佈會)除了散熱,蘋果在 iPhone 17 標準版上也押下重注,A19 晶片首次整合顯示驅動單元,終於為標準版帶來 120Hz 高刷螢幕。在被問及標準版這樣的調整的原因,Kaiann Drance表示,今年是最好的時機。讓顯示單元出現在A19上,包括今年螢幕材質的變化,也都有著相同的考慮。但這樣的回答顯然不具備說服力。在Counterpoint去年10月發佈的iPhone 16系列前三周資料顯示,iPhone 16系列在中國市場銷售開局強勁,與2023年的iPhone 15相比,上市後的前三周銷量增長了20%。其中,iPhone 16的高端型號Pro和Pro Max的銷量尤其好,而iPhone 16和16 Plus這款手機,增速遠不及16 Pro的兩款手機。類似的資料出現在去年的6月,Counterpoint的報告顯示,在618前,得益於iPhone 16系列促銷活動,尤其是iPhone 16 Pro和iPhone 16 Pro Max的銷量上漲,蘋果5月份實現同比的銷量增長。種種跡象表明,iPhone的標準版機型,在過去至少兩年的市場競爭周期中都處於弱勢地位,這成為了加速蘋果調整iPhone設計和產品序列的原動力之一。這一策略調整立竿見影,iPhone 17的國內預售表現上,標準版首次超越 Pro 成為最受歡迎機型,高刷屏的加入功不可沒。蘋果通過 "鈦換鋁" 的設計調整和標準版的關鍵升級,展現了其在產品策略上的靈活性,既保障了 Pro 系列的性能釋放,又成功提升了標準版的市場競爭力。03. iPhone Air,更好的產品?iPhone Air(圖片來源:蘋果秋季新品發佈會)當作者問及Tim Millet“iPhone Air 是否算是理論上更好的產品”時,他會心一笑。這款手機確實承載了蘋果諸多 "第一次":這是蘋果第一個全新的輕薄理念設計的iPhone產品、它搭載的N1和C1X晶片是首次亮相,這是蘋果首款完全取消實體SIM卡的機型。談及晶片時,Tim Millet表示,iPhone Air搭載A19 Pro的晶片,確保了旗艦級性能,N1和C1X的加持則體現了蘋果的核心設計哲學:自研晶片是為了實現更好的功能和產品的創新,而不是單純追求參數。這使Air成為蘋果今年最大的市場試驗田,同時測試兩個關鍵問題:市場對於輕薄型手機的需求強度,多顆自研晶片協同工作的穩定性。關於為何只有 Air 配備C1X基帶晶片,Tim Millet向作者解答,C1X的出現就是為了iPhone Air打造的,想要實現更輕薄的設計,就必須兼顧能效的考慮,C1X在能效方面有很大的優勢。蘋果發佈會公佈的資料顯示,C1X的性能是C1的兩倍,相比iPhone 15 Pro和iPhone 16 Pro Max中運行的驍龍X16更快,且功耗降低30%。iPhone今年的網路差異(圖片來源:蘋果美國官網)但打開美版iPhone的官方參數表會發現,搭載C1X的iPhone Air目前還不支援5G毫米波技術,如果你選擇iPhone Air,就只能讓它的網路工作在6GHz以下的低頻,這意味著對於美國使用者來說,選擇Air要放棄更快的上下行網路速率。這可能也是蘋果尚未將C1X全面替代高通基帶的關鍵因素,但這並不影響蘋果持續推進自研晶片決心。C1和C1X的出現確實讓高通如鯁在喉。蘋果和高通的授權協議將於2027年到期,有分析師預測明年iPhone使用高通基帶晶片的比例將降至20%,到2027年,高通預計將完全退出蘋果供應鏈。高通公司首席執行官安蒙也在今年接受採訪時表示,根據現有合同,若未來無法獲得蘋果的新訂單,我們會坦然接受。同樣的,N1的出現,也打破了博通在過去多年對於iPhone網路通訊晶片的壟斷。“我們打造Apple的晶片,是因為它能夠做到我們從第三方的採購那些晶片做不到的事情。如果沒有Apple晶片的進化,我們就不可能打造出iPhone Air。”Kaiann Drance 補充道。作為“三年創新周期”第一年的產品,iPhone Air 的使命是探索而非顛覆。無論是發佈會出場順序還是預售反饋,都表明它扮演著 "探路者" 的角色。iPhone Air 在當下確實是“更好的產品”,但這只是階段性的。真正意義上的 “更好”,或許要等到兩年後 iPhone 誕生 20 周年時才能實現。 (騰訊科技)
三星Eynos 2600即將量產,多核性能擊敗A19 Pro
9月15日消息,據Fnnews報導,三星的 2nm GAA 技術可能取得了非凡的成果,這也使得其Exynos 2600 的不確定性被解除,目前已經準備好進入量產階段。這也意味著即將推出的Galaxy S26系列旗艦手機,似乎不會再完全採用高通驍龍處理器。不過,Fnnews的報導並未提及三星2nm GAA製程目前的具體良率數字,但今年2月份的時候,傳聞其良率僅為30%。不過,根據爆料人@Jukanlosreve 分享的細節,該公司似乎對 Exynos 2600 能夠投入商業化生產充滿信心。在內部會議上,三星高管透露,三星首款 2nm GAA 製程的Exynos 2600晶片組被認為與Exynos 2500相比將帶來重大的性能飛躍。今年7月,三星LSI業務負責人Yong in Park在一次活動中告訴媒體,“我們正在穩步準備Exynos 2600”,“將會有很好的結果”。到目前為止,他的說法是正確的,因為該晶片組已經提供了驚人的單核和多核結果,在Geekbench 6測試中,單核得分3,309,多核得分11,256。這也使得Exynos 2600 成功地擊敗了降級的高通Snapdragon 8 Elite Gen 5。即便是與蘋果最新發佈的A19 Pro處理器相比,Exynos 2600的多執行緒成績也擊敗了A19 Pro,僅在單執行緒性能上略遜一籌。Exynos 2600預計將由Galaxy S26和Galaxy S26 Edge首發搭載,升級到這些旗艦產品的客戶應該不會覺得沮喪,因為上述晶片結果看起來並不差。此外,該晶片組的成功將有利於三星,因為它將證明該公司的2nm GAA工藝取得了出色的效果,客戶在下訂單時可以恢復信心。然而,一位業內人士此前曾評論稱,三星在先進光刻領域的成功將取決於其第二代2nm GAA工藝,也稱為SF2P。幸運的是,三星在新節點的開發方面似乎提前了計畫,因為據報導它已經完成了製造過程的基本設計,這表明如果一切進展順利,大規模生產可能會在2026年底開始。 (芯智訊)
蘋果A19 Pro跑分曝光:CPU效能提升12%,GPU效能提升37%!
9月12日消息,近日蘋果公司發表的A19系列處理器當中,作為最強的處理器A19 Pro,自然是備受外界關注。而最新的測試資料顯示,A19 Pro在CPU效能上雖然比起前代僅提升了約11%-12%,但如果只看CPU單執行緒效能,則超越了蘋果的桌上型電腦處理器M4以及AMD的銳龍9 9950X。 GPU 效能相比上一代則提升了37%,達到了與蘋果M3當中的GPU以及AMD 的Radeon 890M 整合GPU相當的效能。CPU效能提升11%-12%A19 Pro擁有6個CPU核心,其中包括:兩個高性能核心,運行頻率高達4.26 GHz(相比上代提升6.5%),並具有改進的分支預測(在分支繁重的工作負載下性能更高、能效更高)和增加的前端頻寬(這意味著每周期指令數更高,但並不表明核心每周期可以解碼多少個快取條);最新的測試顯示,全新的A19 Pro處理器在Geekbench 6 基準測試中,CPU單執行緒性能得分3895,比上一代產品高出11%,比高通的驍龍8 Elite 高出36%,並且超越了蘋果自家的M4(高出5.3%)和AMD 強大的銳龍9 91.8%)。不過,由於只有6個CPU核心,因此在多執行緒效能得分為9,746 分,僅比A18 Pro 高出12%。所以,這款智慧手機SoC 在多執行緒工作負載方面仍然無法擊敗桌上型電腦和筆記本電腦的CPU。雖然單執行緒和多執行緒CPU效能11% - 12% 的代際效能提升看起來相當穩健,但與A18 Pro 相比A17 Pro的(約18%)提升相比,這一數字相對較低。需要指出的是,A19 Pro 處理器採用的是台積電第三大3nm(N3P) 工藝製造,N3P 是N3E 的光學縮小版,與N3E 相比,它可在相同功率下將電晶體密度提高4%,性能提高5%,或在相同頻率下將功耗降低5% - 10%。考慮到製程工藝的提升,這也使得A19 Pro的大核心CPU主頻得益提升了6.5%,疊加一些微架構改進,因此其性能的提升幅度達到了約11%-12%。然而,考慮到蘋果在iPhone 19 Pro 上採用了均熱板散熱系統和鋁合金一體成型機身,該公司並未大幅提升CPU 主頻以獲得更高的峰值性能,這著實令人意外。或許蘋果決定專注於分支密集型工作負載,以及/或更高的IPC 效能比單一頻率更能帶來好處。目前看來,這些增強功能在Geekbench 6 中並未顯著提升效能。GPU效能提升37%A19 Pro擁有5核心GPU和6核心GPU兩個版本,該GPU配備了第二代動態快取,提升了浮點數學計算速率,帶來了統一的圖像壓縮。其中,5核心版本的每個GPU當中也整合了神經加速器,峰值運算能力是A18 Pro的3倍。蘋果聲稱這允許在iPhone 中實現MacBook Pro 等級的效能。根據Geekbench 6測試的6核心GPU版本的A19 Pro資料顯示,其GPU得分為45657分,相比上代快了37%。與iPad Air中M2或M3的GPU效能以及AMD的Radeon 890M整合GPU效能相當。此外,最新的分析稱,A19 Pro的GPU還擁有矩陣乘法加速單元(Matrix Multiplication Acceleration Units),這有助於提升AI效能。長期以來,蘋果自研的GPU與輝達一類的顯示卡最大的差異之一,就是缺乏像NVIDIA Tensor Core這類專為張量運算設計的硬體加速核心。 這也是輝達在深度學習和大型語言模型(LLM)運算上遙遙領先的關鍵。 最新的Tensor Core不僅運算速度驚人,更原生支援多種浮點精確度(如FP64、TF32、BF16、FP16等),能與各式大模型訓練及推理引擎完美配合。雖然蘋果這次的GPU升級包含了矩陣乘法加速單元,但這並不等於輝達的Tensor Core。 Tensor Core 是一個更為複雜且全面的運算核心,它不僅能執行矩陣乘法,更針對多種低精度浮點運算(如FP8、FP6)進行了深度最佳化,這些都是現代大模型訓練與推論的關鍵。 也就是說,蘋果的GPU雖然補上了矩陣運算這塊短板,但其原生支援的精確度與運算效率,仍有待後續的技術發展來追趕。在深度學習的世界裡,無論是訓練或推論,最核心且最頻繁的運算就是矩陣乘法(Matrix Multiplication)。 你可以把一個神經網路想像成一系列複雜的數學運算,其中每個神經元之間的連接權重,都可以用一個巨大的矩陣來表示。 當輸入資料(例如一張圖片、一段文字)進入這個網路時,它會與這些權重矩陣進行一系列的乘法運算,以產生最終的輸出。這就是為什麼矩陣乘法的運算速度,直接決定了AI 模型訓練與推論的快慢。 一個好的AI 晶片,其性能高低很大程度上取決於它處理這些巨型矩陣乘法的能力。雖然,蘋果曾大力推廣其自家的“神經網路引擎(ANE)”,蘋果也試圖通過專用硬體來處理AI 任務,然而開發者實際上對於其NPU的應用卻不如預期。首先,ANE的使用體驗極不友善,開發者必須將模型轉換成特定格式才能運行,過程繁瑣。 其次,也是最重要的,ANE 的效能遠遠落後於時代。 由於蘋果最初並未預料到以Transformer 架構為基礎的大型語言模型(LLM)會迅速崛起,這類模型對記憶體頻寬的需求極高,而ANE 的頻寬效能卻表現平平。 根據實測,ANE的最大頻寬僅約120GB/s,甚至不如2016年推出的NVIDIA GTX 1060顯示卡。 這導致在現實應用中,開發者很少會選擇使用ANE 來運行大型模型。因此,在M4 晶片上,蘋果已經開始試水,直接提供最高512GB 統一記憶體的配置,這表明蘋果早已意識到大模型對記憶體容量的巨大需求。如果未來的M5 Max 能搭載頻寬更高的LPDDR6,其記憶體頻寬可望達到900GB/s,將足以與主流消費級顯示卡一較高下。 (芯智訊)